Para los objetivos de este estudio, se pretendía construir un conjunto de datos con variables financieras y deportivas alrededor de los 200 equipos de fútbol participantes en las competiciones de primera y segunda división en España, Inglaterra, Italia, Alemania y Francia durante la campaña 2023/2024. En concreto, la información financiera (balance de situación, cuenta de pérdidas y ganancias, y transacciones de M&A) se extraería de la base de datos ORBIS de Bureau van Dijk, y la información deportiva del portal web Transfermarkt, abarcando los años en el periodo 2009-2023.
En un principio, se intentó un filtrado en ORBIS con palabras clave y códigos identificadores del sector. Sin embargo, el listado resultante no era completo, además de incluir equipos de otros deportes (algunos relacionados con equipos de fútbol, como el Real Madrid Baloncesto), así como otras organizaciones controladas por equipos de fútbol, como lo son las fundaciones benéficas.
De manera que, se buscó manualmente cada club en la base datos con el fin de obtener sus identificadores y filtrar en base a los mismos. En este proceso, se encontró que una porción de los clubes no estaban presentes en la base de datos. En concreto, se lograron identificar 142 equipos. No obstante, la información de las cuentas anuales de interés no estaba presente o completa para todos los años.
Con el fin de tener la mayor cantidad de datos posibles, se buscó manualmente auditorías y reportes anuales de los equipos. En el caso de los equipos ingleses, al ser sociedades limitadas, se encontraron sus auditorías en el portal web del registro mercantil del Reino Unido. Para el resto de equipos, se llevó a cabo una búsqueda exhaustiva en sus páginas web correspondientes. Este procedimiento permitió añadir datos de 30 equipos más, para un total de 172 equipos.
Por otro lado, de Transfermarkt.com se extrajo información acerca del rendimiento deportivo de los equipos (división en la que compitieron, posición conseguida, partidos ganados, goles a favor y en contra, etc) y su actividad en el mercado de transferencia.
Para el análisis, se seleccionaron variables clave del conjunto de datos de ORBIS y Transfermarkt. De las cuentas anuales, se conservaron tres variables: la cifra de inmovilizado material, los ingresos de explotación y el beneficio antes de intereses y después de impuestos. Paralelamente, del conjunto de datos de Transfermarkt, se extrajeron para cada temporada el valor de mercado agregado de la plantilla, el gasto en fichajes, la capacidad máxima del estadio y la asistencia media al estadio. Adicionalmente, se calcularon el ranking nacional del equipo, definido como el percentil de la posición del equipo en relación con todas las posiciones entre la primera y la tercera división, y el porcentaje de victorias en liga sobre el total de partidos jugados. Ambas métricas se calcularon también como medias móviles con una ventana de 5 años.
El glosario con los nombres abreviados escogidos y las descripciones correspondientes para todas estas variables se detallan en la Tabla 1.
| Alias | Descripción |
|---|---|
| EQUIPO | Nombre del equipo |
| PAIS | País de la liga en la que compite el equipo |
| AÑO | Año al que corresponden los datos financieros y deportivos |
| MATERIAL | Cifra del inmovilizado material |
| INGRESOS | Cifra de ingresos de explotación |
| EBIT | Cifra del beneficio antes de impuestos e intereses |
| MV | Valor de mercado agregado de la plantilla, según Transfermarkt.com |
| MV5 | Media del valor agregado de la plantilla en los últimos 5 años |
| FICHAJES | Gasto total en fichajes durante la temporada |
| CAPACIDAD | Capacidad máxima del estadio |
| ASISTENCIA | Número de espectadores medio en partidos locales durante la temporada |
| OCUPACION | Media del porcentaje de ocupación del estadio durante la temporada |
| RANKNAC | Ranking nacional del equipo (percentil de posición en liga sobre las divisiones 1-3) |
| RANKNAC5 | Media del ranking nacional en los últimos 5 años |
| WINPCT | Porcentaje de partidos ganados en liga durante la temporada |
| WINPCT5 | Media del porcentaje de partidos ganados en liga durante los últimos 5 años |
La reducción de la dimensionalidad mediante la aplicación del análisis de componentes principales (PCA), permite explicar el 93,68% de la varianza del conjunto de datos originales a lo largo de 6 dimensiones. La matriz de correlación representada detalla las cargas de cada variable original sobre dichos factores, permitiendo su interpretación y etiquetado. Tras aplicar una rotación varimax sobre los componentes principales, se obtienen unos componentes rotados (RC) cuyas cargas o correlaciones con las variables originales los hacen más fáciles de interpretar. Por esta razón, se decidió utilizar la solución rotada antes que la original para entrenar la malla SOM.
El primer factor muestra una fuerte correlación negativa (r < -0,8) con los ingresos, la cifra de inmovilizado material, y el valor de mercado tanto de la plantilla actual como de la histórica reciente. Además, presenta una correlación negativa moderada (r < -0,5) con el gasto en fichajes y el porcentaje de victorias actual. En resumen, se puede interpretar que el primer componente rotado (RC1) se relaciona con el valor de los principales activos del equipo (estadio y jugadores), así como su capacidad para generar ingresos. Por su parte, el segundo componente rotado (RC2) está fuertemente correlacionado de manera negativa (r < -0,9) con el porcentaje de victorias actual, y en menor grado (r < -0,6) con la media de victorias en los últimos cinco años. El tercer componente rotado (RC3) también destaca por su fuerte correlación negativa (r < -0,8) con el EBIT generado por el club en la temporada actual. En contraste, el cuarto componente rotado (RC4) tiene una fuerte correlación positiva (r > 0,8) con el porcentaje medio de ocupación del estadio. El quinto componente rotado (RC5) está positivamente correlacionado con la capacidad total del estadio (r > 0,8) y con la cifra media de asistencia (r > 0,6). Finalmente, el sexto factor presenta una relación negativa con el ranking nacional actual y el de los últimos cinco años (r < -0,8). La tabla
| RC | Etiqueta |
|---|---|
| 1 | ACTINGR |
| 2 | WINS |
| 3 | EBIT |
| 4 | OCUP |
| 5 | CAPAST |
| 6 | RANK |
Se configuró la malla SOM con unas dimensiones de 15x15, para un total de 225 neuronas, equivalente a un 23% de las observaciones. Por su parte, para el entrenamiento se fijó un total del 10.000 iteraciones, con un learning rate de 0,01. Las Figura 3a y 3b representan los cambios en la distancia [formula] a lo largo de las iteraciones y la asignación de observaciones por neurona, respectivamente. Se observa la estabilización del modelo cerca de las 9.000 iteraciones, con una distancia media a la neurona más cercana inferior a 0,01.
Tras aplicar agrupamiento jerárquico con encadenamiento de Ward sobre las neuronas, se decidió segmentar el mapa en 5 clústeres.
## som_cluster
## 1 2 3 4 5
## 59 29 81 42 14
Tras la realización de pruebas de análisis de varianza (ANOVA), se encontraron diferencias significativas entre los clusters para cada uno de los 6 componentes principales para un nivel de significación del 1% (ver Tablas 6-11). Por lo cual, se procedió a realizar pruebas post-hoc (en concreto, TukeyHSD y Scheffe), pero sobre las variables originales relacionadas a cada uno de los componentes principales, con el fin de poder describir con mayor exactitud los clústers.
| INGRESOS | GRUPO | CLUSTER |
|---|---|---|
| 523,12 | a | 5 |
| 256,95 | b | 2 |
| 81,01 | c | 4 |
| 80,69 | c | 3 |
| 23,31 | d | 1 |
| MV | GRUPO | CLUSTER |
|---|---|---|
| 714,53 | a | 5 |
| 462,78 | b | 2 |
| 143,28 | c | 4 |
| 139,6 | c | 3 |
| 33,67 | d | 1 |
| MV5 | GRUPO | CLUSTER |
|---|---|---|
| 601,82 | a | 5 |
| 407,94 | b | 2 |
| 122,49 | c | 4 |
| 106,15 | c | 3 |
| 32,98 | d | 1 |
| MATERIAL | GRUPO | CLUSTER |
|---|---|---|
| 262,21 | a | 5 |
| 196,44 | b | 2 |
| 53,44 | c | 4 |
| 36,72 | c | 3 |
| 11,33 | d | 1 |
| FICHAJES | GRUPO | CLUSTER |
|---|---|---|
| 133,7 | a | 5 |
| 101,97 | b | 2 |
| 27,11 | c | 3 |
| 26,44 | c | 4 |
| 4,32 | d | 1 |
| WINPCT | GRUPO | CLUSTER |
|---|---|---|
| 62,4 | a | 5 |
| 44,35 | b | 2 |
| 40,14 | c | 3 |
| 35,56 | d | 1 |
| 30,05 | e | 4 |
| WINPCT5 | GRUPO | CLUSTER |
|---|---|---|
| 63,56 | a | 5 |
| 45,96 | b | 2 |
| 38,33 | c | 3 |
| 35,99 | d | 1 |
| 33,91 | d | 4 |
| OCUPACION | GRUPO | CLUSTER |
|---|---|---|
| 84,1 | a | 2 |
| 77,94 | ab | 5 |
| 74,82 | b | 3 |
| 50,74 | c | 4 |
| 50,54 | c | 1 |
| CAPACIDAD | GRUPO | CLUSTER |
|---|---|---|
| 73660,22 | a | 5 |
| 50046,73 | b | 2 |
| 38318,8 | c | 4 |
| 29373,07 | d | 3 |
| 22816,43 | e | 1 |
| ASISTENCIA | GRUPO | CLUSTER |
|---|---|---|
| 56641,12 | a | 5 |
| 40898,87 | b | 2 |
| 22770,54 | c | 3 |
| 18084,06 | d | 4 |
| 12073,91 | e | 1 |
| RANKNAC | GRUPO | CLUSTER |
|---|---|---|
| 97,21 | a | 5 |
| 87,15 | b | 2 |
| 79,64 | c | 3 |
| 78,33 | c | 4 |
| 48,94 | d | 1 |
| RANKNAC5 | GRUPO | CLUSTER |
|---|---|---|
| 97,39 | a | 5 |
| 86,37 | b | 2 |
| 78,94 | c | 4 |
| 75,46 | c | 3 |
| 49,65 | d | 1 |
Clúster 1 - Distress B: Este grupo incluye equipos que generalmente tienen los peores rendimientos tanto financieros como deportivos. Tienen los ingresos más bajos, con una media de €23.31 millones. La inversión en fichajes es mínima, con un promedio de €4.32 millones, y también presentan una baja capacidad de estadio y asistencia. En términos de desempeño deportivo, muestran los peores rankings nacionales y un porcentaje de victorias bajo. Su EBIT también es negativo, indicando pérdidas consistentes.
Clúster 2 - Élite A-: Este clúster agrupa a equipos de alto nivel que no alcanzan el rendimiento de los equipos de élite absoluta. Tienen altos ingresos, en promedio €256.95 millones, y una considerable inversión en fichajes de €101.97 millones. Estos equipos también disfrutan de una alta ocupación del estadio (promedio 84.1%) y un EBIT positivo. Su rendimiento deportivo es notable, con un porcentaje de victorias de alrededor de 44.35%.
Clúster 3 - Moderados: Formado por equipos con un rendimiento y estabilidad medios, a menudo incluye los equipos recién ascendidos a primera división. Tienen ingresos moderados (aproximadamente €80.69 millones) y una inversión en fichajes media, unos €27.11 millones. Aunque los porcentajes de ocupación y asistencia al estadio son intermedios, estos equipos muestran una mejora en sus rankings nacionales en los últimos 5 años, sugiere que su rendimiento deportivo y financiero ha ido mejorando.
Clúster 4 - Distress A: Equipos que, aunque tienen ingresos bajos-moderados (alrededor de €81.01 millones), su situación financiera y deportiva está en declive. Presentan pérdidas en EBIT, ocupación baja del estadio y niveles reducidos de asistencia. La inversión en fichajes es similar a la del clúster 3, pero su rendimiento deportivo ha disminuido en comparación con sus propias marcas históricas.
Clúster 5 - Élite A+: Los mejores equipos en términos de desempeño financiero y deportivo. Tienen los ingresos más altos, promediando €523.12 millones, y una inversión significativa en fichajes de €133.7 millones. También presentan las capacidades y asistencias más altas en los estadios, con una ocupación promedio del 77.94%. Líderes en el ranking nacional, muestran un rendimiento deportivo excepcional con el mayor porcentaje de victorias (62.4%) y el EBIT más alto.
El siguiente paso consiste en la estimación de los ratios EV/Ingresos para cada clúster. Esta estimación se basa en las transacciones encontradas sobre las observaciones de los equipos. Para ello, se emplearán tres metodologías de estimación distintas: 1) la media del valor de transacción sobre ingresos por clúster, 2) la mediana, y 3) una media ponderada por distancia. Esta última técnica toma en consideración la distancia existente entre la neurona correspondiente a cada observación y la neurona asignada a cada transacción dentro del clúster. Esta triangulación permitirá una visión más precisa y robusta de la valoración económica de los equipos, proporcionando una base sólida para su valoración.
| Cluster | Nº transacciones | % media | Ratio medio | Ratio mediano |
|---|---|---|---|---|
| Distress B | 3 | 90.000000 | 2.9718582 | 2.440206 |
| Élite A- | 10 | 52.474900 | 2.7938865 | 1.468683 |
| Moderados | 7 | 32.595714 | 0.9531937 | 1.119343 |
| Distress A | 6 | 76.655000 | 2.2652083 | 1.283890 |
| Élite A+ | 12 | 7.685667 | 2.3337927 | 1.958711 |